بهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز

Authors

محمدعلی زارع چاهوکی

دانشگاه یزد سیدحمیدرضا محمدی

دانشجوی کارشناسی ارشد

abstract

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش های یادگیری ماشین بر اساس ویژگی های صفحات اشاره کرد. ازجمله الگوریتم های یادگیری ماشین که در این حوزه استفاده شده است ولی نتایج قابل توجهی را ارائه نکرده، الگوریتم ماشین بردارپشتیبان[i] (svm) است. استفاده از هسته در ساختار طبقه بند svm باعث می شود که داده هایی که دارای الگوی غیرخطی هستند با نگاشت به فضایی با ابعاد بیش تر بتوانند با مدل خطی تفکیک پذیر شوند. این کار باعث افزایش دقت تفکیک کنندگی مدل یادگیری ماشین می شود. اخیراً توسعه ایی از svm با نام svm جفتی[ii] (tsvm) ارائه شده است که با تغییر در فرضیه اولیه آن، از دو اَبَرصفحه[iii] برای تفکیک نمونه های هر کلاس استفاده می کند و توانسته نتایج بهتری در طبقه بندی ارائه کند. به دلیل استفاده از دو ابرصفحه در tsvm، لذا بهتر است تا از هسته های چندگانه در ساختار آن استفاده شود. به دلیل اینکه توابع هسته در هر کاربرد اختصاصی هستند لذا نمی توان از یک هسته عمومی برای همه کاربردها استفاده کرد. در این مقاله برای بهینه سازی ترکیب های بهینه توابع هسته پایه، از روشی تکاملی مبتنی بر الگوریتم ژنتیک (ga) استفاده شده است که با بهره گیری از آن در فرآیند تصمیم گیری هر اَبَرصفحه tsvm، بهبود در تشخیص صفحات فریب حاصل گردیده است. برای پیاده سازی و ارزیابی روش پیشنهادی، از مجموعه دادگان uk-2006 و uk-2007 استفاده شده است که نتایج حاصل بیانگر مؤثر بودن ایده پیشنهادی در این پژوهش است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

بهینه‌سازی هسته‌های چندگانه در ماشین‌بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب‌آمیز

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص‌گذاری آن‌ها، قابلیت جستجوی سریع اطلاعات را به کاربران می‌دهند. یکی از چالش‌های مهم در استفاده از این ابزار، صفحاتی هستند که از آن‌ها به‌عنوان صفحات فریب‌آمیز نام‌ برده می‌شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع ‌شده است که می‌توان به روش‌هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از رو...

full text

ارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی

امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد...

15 صفحه اول

رتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز

با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مق...

15 صفحه اول

بررسی عملکرد الگوریتم های فراابتکاری جمعیت مبنا به منظور بهینه سازی پارامترهای ماشین های بردارپشتیبان درطبقه بندی تصاویرپلاریمتریک راداری

با توجه به اینکه استفاده از پلاریزاسیون های مختلف امواج الکترومغناطیسی در تصویربرداری پلاریمتریک راداری اطلاعاتی غنی از جنبه های مختلف عوارض را فراهم می کند. امروزه تصاویر پلاریمتری به عنوان ابزار قوی و کارآمد در زمینه ی شناسایی عوارض مختلف در مناطق جغرافیایی پیچیده مورد توجه قرارگرفته اند. به منظور استخراج اطلاعات، طبقه بندی این تصاویر حائز اهمیت می-باشد. طبقه بندی کننده ی ماشین های بردار پشتی...

full text

My Resources

Save resource for easier access later


Journal title:
مهندسی برق دانشگاه تبریز

جلد ۴۶، شماره ۴، صفحات ۱۳۵-۱۴۵

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023